ㄱ. 비지니스 이해 및 범위 설정 ㄴ. 프로젝트 위험 계획 수립 ㄷ. 프로젝트 정의 ㄹ. 프로젝트 수행 계획 수립
대표적인 빅데이터 분산처리 엔진으로, 하둡의 단점을 보완하기 위해 인메모리(In-Memory)기반의 데이터 처리 오픈소스 플랫폼
시스템의 전방에 위치하여 클라이언트로부터 다양한 서비스를 처리하고, 백-엔드 서비스 간의 통신을 전달하는 미들웨어
데이터에 노이즈를 추가하여 개인정보보호와 데이터 분석을 모두 진행할 수 있는 기법
정규분포를 따르고 평균이 150, 분산이 16인 자료에 대하여 모든 자료에 (-150)/4의 스케일링을 적용하면 자료의 분포는 어떤 분포를 따르는가?
항목집합의 지지도를 산출하여 발생빈도와 최소지지도를 기반으로 거래 연관성을 밝히는 알고리즘
비지도학습은 라벨링이 ( A ), 예시로는 ( B )이다. 비지도 학습이란 타깃 변수의 라벨링이 ( A ) 모형을 의미하며, 대표적인 모형 예시로는 ( B ) 가 있다.
중장기적인 특성을 가지며, 빈번한 발생 빈도 없이 특정 주기로 반복적인 패턴을 보이는 특성
y=0 혹은 y=1 값을 가지는 이진 분류 분석에서 실제 y=1(True)의 값이 y=0(False)값의 2배일 때 민감도, 이도, 정확도에 대한 설명으로 옳은 것을 고르시오.
ㄱ. 검정을 위해 하루에 몇 회인지 평균을 구해야 한다. ㄴ. 카이제곱 값이 클수록 귀무가설을 기각한다. ㄷ. 귀무가설은 관측값이 포아송분포를 따른다.
모멘텀 방식과 AdaGrad를 결합한 방식으로, 가속도와 학습률 조정을 동시에 적용한 알고리즘이다.
FN은 정답이 경우 (1, True)를 우리가 정답이 아닌 것으로(0, Negative)로 예측한다. 그렇다면 TP가 의미하는 것으로 옳은 것은?
문제정의 > 표준화 > ( ) > 일반화